home *** CD-ROM | disk | FTP | other *** search
/ Collection of Internet / Collection of Internet.iso / infosrvr / dev / www_talk.930 / 000347_connolly@pixel.convex.com _Thu Nov 19 11:25:10 1992.msg < prev    next >
Internet Message Format  |  1994-01-24  |  3KB

  1. Return-Path: <connolly@pixel.convex.com>
  2. Received: from dxmint.cern.ch by  nxoc01.cern.ch  (NeXT-1.0 (From Sendmail 5.52)/NeXT-2.0)
  3.     id AA13575; Thu, 19 Nov 92 11:25:10 MET
  4. Received: by dxmint.cern.ch (dxcern) (5.57/3.14)
  5.     id AA22828; Thu, 19 Nov 92 11:37:43 +0100
  6. Received: from pixel.convex.com by convex.convex.com (5.64/1.35)
  7.     id AA01932; Thu, 19 Nov 92 04:37:25 -0600
  8. Received: from localhost by pixel.convex.com (5.64/1.28)
  9.     id AA16353; Thu, 19 Nov 92 04:37:23 -0600
  10. Message-Id: <9211191037.AA16353@pixel.convex.com>
  11. To: www-talk@nxoc01.cern.ch
  12. Subject: HTML DTD issues
  13. Date: Thu, 19 Nov 92 04:37:23 CST
  14. From: Dan Connolly <connolly@pixel.convex.com>
  15.  
  16.  
  17. The thrust to register HTML with the authorities has
  18. spurred me to look over the DTD again. I've found
  19. some problems.
  20.  
  21. 1. Currently the NAME attribute of an anchor is declared
  22. as CDATA, i.e. just about anything. There's an SGML thingy
  23. called an ID. SGML parsers enforce uniqueness among the IDs
  24. of a document. Seems like that's what we want for ID names.
  25.  
  26. But an SGML ID has to start with a letter. So all the
  27. HTML files that use numbers as anchor names will break.
  28.  
  29. 2. I introduced two tag names when I drafted the DTD:
  30.     HTML contains the whole document. I defined it
  31. so you can omit both the start and the end tags, so it's
  32. inferred by SGML parsers. I don't think I can avoid some
  33. top-level tag.
  34.     DOCUMENT contains most of the "body" -- all the
  35. headings and paragraphs. I did this to avoid something
  36. called mixed content, which causes complications.
  37. I could rename this element as BODY, and introduce a
  38. omitable HEADING tag to surround the TITLE, NEXTID,
  39. and ISINDEX tags.
  40.  
  41. 3. I stuck anchors in as an inclusion, meaning they
  42. could be used just about anywhere. I thought stuff
  43. like
  44. <a name=foo><h1>Foo</h1></a>
  45. was legal, but neither linemode nor the midas browser
  46. groks.
  47.  
  48. I'm editing the DTD to restrict the usage of anchors
  49. to only contain text strings.
  50.  
  51. 4. The OL tag is disappearing. It's no longer documented
  52. in the web, and it's not supported by MidasWWW. Should
  53. I delete it from the DTD?
  54.  
  55. 5. What about <HP1> thru <HP5>... should we include them?
  56. I'd prefer <em>, <tt>, <cite>, ala TeX. Or we could
  57. go with the O'Reilly/Hal DocBook tags:
  58. <Emphasis>, <OopsChar>, <wordasword>,<CiteBook>,<Subscript>,
  59. <Superscript>.
  60.  
  61. 6. Any more thoughts on the BaseAddress tag?
  62.  
  63. 7. The HTML tags documentation says Listing sections can contain
  64. any ISO Latin 1 characters. The SGML standard mentions ISO 646,
  65. i.e. ascii, as the default, but the sgmls parser, the linemode
  66. browser, and MidasWWW all seem to grok Latin1 just fine.
  67.  
  68. Dan